Common Voice数据集

# Common Voice数据集

Whisper Kurmanji

针对库尔德语库尔曼吉方言的自动语音识别模型，基于Whisper架构微调

Safetensors 其他

Whisper Small Ta

该模型是基于OpenAI的Whisper Small在泰米尔语Common Voice 17.0数据集上微调的语音识别模型，词错误率(WER)为43.23%。

Transformers 其他

Whisper Small Fr

这是一个基于法语数据集微调的Whisper-small语音识别模型，词错误率相比基线模型降低了6.793个百分点。

Transformers 法语

Whisper Base Pl

基于OpenAI Whisper-base模型在波兰语Common Voice 17.0数据集上微调的语音识别模型

Transformers 其他

Vlzcrz Whisper Small Japanese 2

基于openai/whisper-small在Common Voice 17.0数据集上微调的日语语音识别模型

Transformers 日语

Whisper Large V3 Cantonese

基于Whisper v3微调的粤语自动语音识别模型，在Common Voice 17数据集上训练

Transformers 其他

Finetuned Whisper Mr

基于simran14/mr-model-h在Common Voice 17.0马拉地语数据集上微调的Whisper小型语音识别模型

Transformers 其他

Wav2vec2 Large Xls R 300m Amharic Demo Colab

基于facebook/wav2vec2-xls-r-300m在common_voice_16_1数据集上微调的阿姆哈拉语语音识别模型

Whisper Large V3 Japanese 4k Steps

基于openai/whisper-large-v3在Common Voice 16.1日语数据集上微调的语音识别模型，训练4000步

Transformers 日语

Wav2vec2 Large Xls R 300m Albanian Colab

该模型是基于facebook/wav2vec2-xls-r-300m在common_voice_albanian数据集上微调的语音处理模型，适用于阿尔巴尼亚语相关任务。

Wav2vec2 Large Xlsr Mvc Swahili

该模型是基于facebook/wav2vec2-large-xlsr-53微调的版本，专门用于斯瓦希里语（Swahili）的自动语音识别任务。

Transformers 其他

Whisper Small Dv

基于OpenAI Whisper-small模型微调的迪维希语(马尔代夫官方语言)自动语音识别模型，在Common Voice 13数据集上训练

Transformers 其他

Whisper Small Fa

Hezar团队基于Common Voice数据集的波斯语部分微调的Whisper (small) 模型，可用于自动语音识别任务。

语音识别其他

Tts Thai Last Step

这是一个基于Tacotron2架构的泰语文本转语音模型，使用修改后的Common Voice泰语数据集训练，声音经过处理不保留原始特征。

语音合成其他

基于Tacotron2架构的泰语文本转语音模型，使用修改后的Common Voice泰语数据集训练

语音合成其他

这是一个基于Whisper small架构的孟加拉语自动语音识别模型，在约400小时的Mozilla Common Voice数据集上微调训练，词错误率4.58%

bangla-speech-processing

Whisper Large Persian

基于Whisper架构的波斯语自动语音识别模型，在Common Voice 11.0波斯语数据集上微调

Transformers 其他

Whisper Large V2 Kazakh

该模型是基于OpenAI的Whisper Large V2在哈萨克语Common Voice 11.0数据集上微调的语音识别模型

Transformers 其他

Whisper Tiny Es

基于OpenAI Whisper-tiny模型在西班牙语数据集上微调的语音识别模型

Transformers 西班牙语

Exp W2v2t Zh Cn Wavlm S596

基于microsoft/wavlm-large模型微调的中文语音识别模型，支持简体中文，使用Common Voice 7.0 (zh-CN)数据集训练。

Exp W2v2t Fa Hubert S801

基于facebook/hubert-large-ll60k模型微调的波斯语自动语音识别模型，使用Common Voice 7.0波斯语数据集训练。

Transformers 其他

Exp W2v2t Sv Se Wavlm S42

基于microsoft/wavlm-large微调的瑞典语自动语音识别模型，适用于16kHz采样率的语音输入。

Exp W2v2t It Wavlm S895

基于microsoft/wavlm-large模型微调的意大利语自动语音识别模型，使用Common Voice 7.0意大利语数据集训练。

Transformers 其他

Exp W2v2t It No Pretraining S842

基于随机初始化的wav2vec2模型进行微调，用于意大利语语音识别任务，训练数据采用Common Voice 7.0（意大利语）的训练集分割部分。

Transformers 其他

Exp W2v2t It Xlsr 53 S387

基于facebook/wav2vec2-large-xlsr-53模型微调的意大利语自动语音识别模型，使用Common Voice 7.0意大利语数据集训练。

Transformers 其他

Exp W2v2t It Wav2vec2 S609

基于facebook/wav2vec2-large-lv60模型微调的意大利语自动语音识别模型，使用Common Voice 7.0意大利语数据集训练。

Transformers 其他

Exp W2v2t Ja Xlsr 53 S109

基于facebook/wav2vec2-large-xlsr-53模型微调的日语自动语音识别模型，使用Common Voice 7.0日语数据集训练

Transformers 日语

Exp W2v2t Th Hubert S533

基于facebook/hubert-large-ll60k微调的泰语语音识别模型，训练数据来自Common Voice 7.0

Transformers 其他

Exp W2v2t En Vp Nl S281

基于facebook/wav2vec2-large-nl-voxpopuli模型微调的英语语音识别模型，使用Common Voice 7.0训练集进行训练。

Transformers 英语

Wav2vec2 Large Xls R 300m Hindi Epochs15 Colab

这是一个基于facebook/wav2vec2-xls-r-300m模型在common_voice数据集上微调的语音识别模型，支持印地语。

Wav2vec2 Large Xls R 300m Tamil Colab

该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的泰米尔语语音识别模型

Model Facebookptbrlarge

基于Facebook wav2vec2-large-xlsr-53-portuguese模型在common_voice数据集上微调的巴西葡萄牙语语音识别模型

Wav2vec2 Base Common Voice 50p Persian Colab

该模型是基于facebook/wav2vec2-base在波斯语数据集上微调的语音识别模型，支持波斯语语音转文本任务。

Wav2vec2 Base Common Voice Persian Colab

该模型是基于facebook/wav2vec2-base在波斯语数据集上微调的语音识别模型，主要用于波斯语语音转文本任务。

Wav2vec2 Common Voice Tr Demo Dist

该模型是基于facebook/wav2vec2-large-xlsr-53在COMMON_VOICE - TR土耳其语数据集上微调的自动语音识别(ASR)模型，在评估集上取得了0.3242的词错误率。

Transformers 其他

Wav2vec2 Large Xls R 300m Turkish Colab Common Voice 8 5

这是一个基于wav2vec2架构的土耳其语语音识别模型，在Common Voice数据集上微调，词错误率(WER)为0.3634。

Wav2vec2 Large Xls R 300m Turkish Colab Common Voice 8 4

该模型是基于Facebook的wav2vec2-xls-r-300m模型，在common_voice土耳其语数据集上微调的语音识别模型。

Wav2vec2 Xls R 300m Mr Cv9 With Lm

基于Facebook XLS-R-300M模型在马拉地语语音数据集上微调的自动语音识别模型

Transformers 其他

Wav2vec2 Xls R 300m Ur Cv9 With Lm

该模型是基于facebook/wav2vec2-xls-r-300m在乌尔都语语音数据集上微调的自动语音识别(ASR)模型

Transformers 其他

Common Voice Lithuanian Fairseq

基于Common Voice数据集训练的立陶宛语自动语音识别模型，使用wav2vec2架构和fairseq框架实现。

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24